大规模数据相关论文
缺失值插补(missing value imputation,MVI)作为数据挖掘领域的重要研究分支,旨在为机器学习算法的训练提供高质量的数据支持。不同......
近年来,空气污染问题已经开始变为世界关注的焦点,PM2.5颗粒物是大气污染物中的主要组成元素,有效地对PM2.5浓度进行统计建模分析,......
随着信息技术的发展,各领域的数据规模以惊人的速度扩张,这一方面给机器学习、数据挖掘等任务带来了更多的训练信息,另一方面增加......
数据产生价值,数据也是统计科学发展的动力.随着科技的迅猛发展,数据收集成本的降低导致海量数据以涌现形式出现,这些数据不仅规模......
作为数据挖掘的重要分支,尽管离群检测和聚类分析已被广泛研究多年,现仍处于蓬勃发展阶段。在离群检测和聚类分析任务中,特别是局......
为解决大规模数据在进行回归分析时存在的计算内存不足和运行时间较长的问题,提出两个新的回归分析方法:先筛选后抽样的大规模数据......
随着计算和数据采集技术的发展,在各个应用领域中积累了大量复杂数据.这些数据中往往蕴含着直接或潜在的网络(图)结构.网络数据分析......
目前缺失数据的存在已经成为数据质量问题中无法避免的影响因素。各领域研究中经常遇到数据缺失问题,该问题不仅影响研究结果的精......
随着大数据时代的到来,数据的产生和使用日益增多,同时随着数据存储技术的进步,使得收集到的数据的规模越来越庞大,但是收集到的数......
为了提高大规模非结构化数据的分布式存储能力,提出基于空间网格聚类的大规模非结构化数据分布式存储方法.构建大规模非结构化数据......
本文围绕将XML用于数据库应用中所遇到的问题,尤其是性能问题,进行了讨论.并通过一个试验程序,具体考察了XML和关系数据库在处理较......
据信息技术研究和顾问公司Gartner数据显示,2016年第四季度,全球服务器收入同比下降1.9%,而出货量较2015年第四季度下降0.6%。2016......
4月15日,赛门铁克公司发布了第十九期《互联网安全威胁报告》(ISTR)。报告揭示,2013年数据泄露事件的数量较上一年增加62%,大规模......
Cross-stream串行底板收发器芯片集包括了VSC880 16×16 2G比特/秒串行交换器和VSC870 2G比特/秒同步串行收发器。该芯片集使得同......
快速傅立叶变换(FFT)在计算机层析影象技术,语音识别,图象处理等领域得到了广泛的应用。随着计算机应用的发展,越来越需要对大规模的数......
在经历了一系列风波后,王功权回到商界再创业。从1998年进入风投领域,他见证了中国风投行业从萌芽到日趋成熟的发展过程。拥有近二......
【目的】提高用户参与度,实现大规模数据的高效管理和信息的快速查询,完善企业网站信息组织与表示。【应用背景】网上交易信息庞杂......
国家行政执法的程序规范化工作,是有效实现一个国家行政治理体系现代化的必要创新路径,而利用大数据技术作为一种有效助推创新工具,能......
随着通信和互联网技术的发展,网络规模逐渐扩大。诸如高清视频和图像等大数据量的多媒体业务正不断涌现,多播和广播技术得到了广泛......
随着经济发展,汽车数量急剧增加,交通拥堵、事故、尾气污染等交通问题日益严重。智能交通系统(ITS)是目前公认的解决交通问题的途......
近年来,信息发布的方式越来越多样和便捷,无线传感器、移动设备等越来越普及,云计算、物联网等技术也得到了迅猛的发展,使得数据规模急......
秘密分享技术是现代密码学领域中的一个重要分支,同时也是信息安全方向研究的一个重要课题。秘密分享最初是为解决密钥管理问题而产......
支持向量机Support Vector Machine, SVM)是机器学习领域的有效工具,以其快捷的训练方法和良好的泛化性能受到人们的广泛关注,在函......
进化树(phylogenetic tree)是用于描述基因或者物种之间进化关系的树型拓扑结构,又称为系统发生树。进化树的构建是根据基因序列信......
最小最大模块化支持向量机(M3-SVM)是一种可以有效处理大规模数据分类问题的有监督集成学习算法。然而,对大规模数据进行标注是“......
无论是在图形学领域还是计算机辅助设计及各种模拟计算方法中,特征都是几何模型中最重要的部分,由于其具有特殊的几何性质,被广泛......
大规模数据存储面临着数据容量大、数据结构复杂、基础设施异构、失效常态化等问题。高效的、去中心化的元数据管理方案对大型分布......
随着科学技术的不断发展,社会的各行各业都发生了显著变化,燃气作为城市建设的重要组成部分,也得到了创新发展,尤其是互联网技术的......
近年来,随着数据的采集和存储技术的飞速发展,尤其是互联网的广泛应用,各行各业积累了大量的数据。为了从数据中挖掘出更多的有用......
聚类在数据挖掘、机器学习以及模式识别等领域有着非常广泛的应用,聚类分析是一种针对无标签数据的无监督学习方法。聚类集成的优......
随着信息化时代的快速发展以及互联网技术的不断提升,导致许多行业产生的数据样本呈指数级别增长,数据维度也在不断攀升。受“数据......
随着信息时代的飞速发展,各种数据呈现出爆炸式的增长态势。同时,数据形式也变得复杂且多样,给以机器学习为核心技术的数据挖掘带......
语义表示是自然语言处理的基础,我们需要将原始文本数据中的有用信息转换为计算机能够理解的语义表示,才能实现各种自然语言处理应......
10日,国务院总理李鹏在全国加快第三产业发展工作会议上强调,加快第三产业是关系全局的重大任务。同日,新华社消息,国家科委和国......
1.前言对于已形成产业的数据库的生产、提供、利用的流通状况至今已发表了许多资料。日本科学技术情报中心(JICST)已根据这些资料......
2004年11月11日,由AMD和富士通公司的闪存部门合并而成的Spansion宣布了一系列雄心勃勃、为期三年的远景规划和战略计划。该公司正......
IBM日前发布了ELS大数据策略,阐述ELS在大数据时代的全新策略,旨在帮助企业用户抓住大数据带来的机遇,应对大数据给基础架构带来的......
为解决当前固态存储系统有效适应大规模数据高速存储的问题,以NAND Flash为存储介质,利用循环SRAM缓冲、多体存储阵列、交叉开关矩......
日前,由浪潮集团设计制造完成的新型服务器SmartRack整机柜服务器(百度整机柜服务器)在百度内蒙古数据中心部署完成,该产品是以机......
9月2日,中文搜索引擎百度与中国科学院计算技术研究所签署战略合作协议,共同研究面向大规模高性能数据处理的创新性计算技术。百......
长期的运营数据积累、客户数据的几何级增长使得“数据(Data)”的价值从“量变”终于到达了“质变”的爆发点。12年上半年,“大数......
生态是阿里云计算存在的意义,没有生态,将不存在某一个产业的独活。10月的一个大早,杭州转塘,一个以云计算为生态主导的小镇-云栖......
From:广西贵港市 189****2200 我妈特别毒舌,有一次和她走在路上,我一下子被绊了,我妈在旁边:“你都四只眼睛了,还看不清路呀?!”我……......